几十年来,多维数据集中的模式发现是研究的主题。存在可用于此目的的广泛的聚类算法。但是,它们的实际应用共有普遍的聚类阶段,涉及基于专家的解释和对获得的结果分析。我们认为这可以是该过程的瓶颈,特别是在聚类之前存在域知识的情况下。这种情况不仅需要对自动发现的集群进行适当的分析,而且还需要与现有知识的一致性检查。在这项工作中,我们展示了知识增强聚类(KNAC),主要目标是通过自动聚类来协调基于专家的标签,以便更新和精炼前者。我们的解决方案不依赖于任何准备好的聚类算法,也不介绍一个。相反,KNAC可以用作任意聚类算法的增强,使得该方法具有鲁棒和模型不可知。我们展示了我们在人工,可重复的例子和真实用途案例场景中的方法的可行性。
translated by 谷歌翻译
The outbreak of the SARS-CoV-2 pandemic has put healthcare systems worldwide to their limits, resulting in increased waiting time for diagnosis and required medical assistance. With chest radiographs (CXR) being one of the most common COVID-19 diagnosis methods, many artificial intelligence tools for image-based COVID-19 detection have been developed, often trained on a small number of images from COVID-19-positive patients. Thus, the need for high-quality and well-annotated CXR image databases increased. This paper introduces POLCOVID dataset, containing chest X-ray (CXR) images of patients with COVID-19 or other-type pneumonia, and healthy individuals gathered from 15 Polish hospitals. The original radiographs are accompanied by the preprocessed images limited to the lung area and the corresponding lung masks obtained with the segmentation model. Moreover, the manually created lung masks are provided for a part of POLCOVID dataset and the other four publicly available CXR image collections. POLCOVID dataset can help in pneumonia or COVID-19 diagnosis, while the set of matched images and lung masks may serve for the development of lung segmentation solutions.
translated by 谷歌翻译
发展新方法的地表水观察方法对于与全球变暖和日益增长的水需求有关的越来越频繁的极端水文事件至关重要。使用UAV摄影测量获得的正轨和数字表面模型(DSM)可用于确定河流的水面升高(WSE)。然而,由于摄影测量算法的局限性引起的DSM上的水面的干扰,这项任务很困难。在这项研究中,使用机器学习来从受干扰的摄影测量数据中提取WSE值。通过水文和摄影测量专家专门为此目的准备了一个全新的数据集。新方法是朝着具有高空间和时间分辨率的水面测量的重要一步。这些数据可用于验证和校准水文,液压和流体动力学模型,使水文预报更准确,特别是预测洪水或干旱等极端和危险事件。为我们的知识,这是第一种为此目的创建数据集的方法,并且为此任务使用了深度学习模型。此外,设置了神经发展算法以探索不同的架构以查找本地最佳模型,并执行非梯度搜索以进行微调模型参数。与从摄影测量DSMS确定WSE的手动方法相比,实现的结果具有更好的准确性。
translated by 谷歌翻译